داده کاوی داده های طبی با رویکرد کاهش ابعاد مجموعهی داده
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده علوم ریاضی
- نویسنده منیژه قایمی دیزجی
- استاد راهنما محمدرضا فیضی درخشی سعید پاشازاده
- سال انتشار 1391
چکیده
دادهکاوی یکی از مراحل کشف دانش است و دانش حاصل از دادهکاوی در زمینههای گوناگون از جمله تجارت و پزشکی مورد استفاده قرار میگیرد. امروزه با پیشرفت علم و دانش، اطلاعات ذخیره شده در مورد موجودیتها در پایگاهدادهها نیز در حال افزایش است. مطالعات نشان دادهاند که بیشتر مواقع همهی اطلاعات در مورد موجودیتها نه تنها برای دادهکاوی مفید نیستند، بلکه مشکلاتی را برای دادهکاوی ایجاد میکنند. بنابراین سعی میشود با استفاده از فرایند انتخاب مولفه، مولفههای مفید و مربوط برای یادگیری انتخاب شده و مولفههای زاید و نامربوط کنار گذاشته شوند. ولی همیشه کنار گذاشتن قطعی برخی مولفهها قبل از دادهکاوی مطلوب نیست. در این مواقع سعی میشود اهمیت مولفهها برای دادهکاوی مشخص شود که این روند توسط الگوریتمهای وزندهی مولفه صورت میگیرد. انتخاب و وزندهی مولفه از جمله مسائل غیر چندجملهای سخت هستند که اخیراً استفاده از الگوریتمهای تکاملی برای حل این مسائل نتایج قابل قبولی را نشان داده است. طبیعت همواره مورد الهام بسیاری از افراد بوده است؛ بهطوریکه افراد مختلف سعی کردهاند با استفاده از روندهای موجود در طبیعت به حل مشکلات موجود بپردازند. از جمله الگوریتمهای تکاملی مبتنی بر طبیعت میتوان به الگوریتم ژنتیک و مورچهها اشاره کرد. در این راستا در این پایاننامه با توجه دقیق به روند موجود در جنگل، الگوریتم تکاملی جدیدی به نام الگوریتم جنگل ارائه شده است. به منظور بررسی کارایی الگوریتم پیشنهادی جنگل، 3 تابع آزمون در حالت 5 و 10 بعدی مورد بررسی قرار گرفته است. نتایج بدست آمده نشان دهندهی برتری قاطع الگوریتم جنگل از نظر زمان و تعداد نسل رسیدن به جواب نزدیک به بهینه نسبت به الگوریتم ژنتیک است. در این پایاننامه مسالهی وزندهی مولفه با استفاده از الگوریتم پیشنهادی جنگل حل شده است. نتایج آزمایشها بر روی مجموعه دادههایی با اندازههای مختلف نشان دادند که الگوریتم جنگل میتواند کارایی الگوریتم یادگیری نزدیکترین همسایگی را با استفاده از وزندهی مولفه، در 4 مجموعه داده از 7 مجموعه دادهی انتخابی به خوبی بهبود ببخشد. به منظور بررسی بیشتر کارایی الگوریتم جنگل، مسالهی انتخاب مولفه نیز با استفاده از الگوریتم جنگل حل شده است. نتایج آزمایشها بر روی 6 مجموعه داده نشان دادند که الگوریتم جنگل میتواند کارایی الگوریتم نزدیکترین همسایگی را در 4 مجموعه داده به خوبی بهبود ببخشد. در 2 مجموعه دادهای که الگوریتم جنگل نتوانسته است بهتر از روشهای موجود عمل کند، دارای رتبهی دو است.
منابع مشابه
کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره
تشخیص دادههای خارج از ردیف چند متغیره به کمک الگوریتمهای دادهکاوی یکی از نکات ضروری پیشپردازش دادههای اکتشافات ژئوشیمیایی محسوب میشود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روشهای آماری، روشهای مبتنی بر مجاورت، روشهای مبتنی بر خوشهبندی و روشهای مبتنی بر دستهبندی هستند، معرفی شده و کاربرد آنها بر روی دا...
متن کاملپیش بینی گزارش حسابرس مستقل در ایران : رویکرد داده کاوی
با افزایش مبادلات تجاری، اقتصادی، پیشرفت تکنولوژی اطلاعات و انباشته شدن داده های مالی، تکنیکهای داده کاوی به منظور استفاده بهینه و کارا از این داده ها رواج یافت. هدف این پژوهش پیش بینی گزارش حسابرس مستقل با استفاده از تکنیک های داده کاوی می باشد. اهمیت پیش بینی گزارش حسابرس مستقل در تاثیر آن بر تصمیم گیری استفاده کنندگان می باشد.گزارش حسابرس مستقل در این تحقیق به دو دسته مقبول و غیرمقبول (شامل ...
متن کاملداده کاوی احتمال وقوع خشکسالی در ایران
خشکسالی در سالهای اخیر خسارات زیادی به کشور وارد ساخته است که باید تلاش کرد تا با استفاده از مدیریت منطقی، حتیالامکان خسارات ناشی از آن را کاهش داد. بدین منظور لازم است تا مناطق متأثر از این بلا مقایسه شوند و در اولویت اقدامات مدیریتی قرار گیرند. هدف از انجام این مطالعه تهیه نقشه شاخص خطر خشکسالی ایران است. در این تحقیق دادههای بارش ماهانه 46 ایستگاه انتخاب شدند. بهمنظور تهیه نقشه شاخص DHI ...
متن کاملبررسی کاربردهای داده کاوی در نظام سلامت
Introduction: Extensive amounts of data stored in medical databases require the development of specialized tools for accessing the data, data analysis, knowledge discovery, and the effective use of the data. Data mining is one of the most important methods. The article sketches the used Data Mining techniques, and illustrates their applicability to medical diagnostic and prognostic problems. ...
متن کاملداده کاوی و کاربرد آن در تصمیمگیریها
ابهامات محیطی ناشی از مدلهای نوین کسب و کار سبب تشدید پیچیدگی در تصمیمگیری، بهویژه در حوزه کسب و کار شده است. بهطوریکه بسیاری از متغیرهای تاثیرگذار ناشناخته بوده و روابط میان آنها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمیتوان دادهها را با ابزارهای سنتی تحلیل نموده و از آنها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...
متن کاملتخمین میزان بقاء پیوند کلیه با استفاده از داده کاوی
هدف: نارسایی کلیه از مشکلات پرهزینه جوامع انسانی بهشمار میرود و استفاده از درمانهای جایگزین در حوزه کلیه در جهان و ایران رو به افزایش میباشد. بقاء یکی از حوزههای پیشآگهی پزشکی است و داده کاوی فرایند کشف روابط و الگوهای مناسب در دادههاست که به عنوان روشی کارامد برای تحلیل بقاء شناخته میشود. هدف مطالعه حاضر، پیشبینی بقاء پیوند کلیه بیمار بر اساس متغیرهای پیش از پیوند کلیه میباشد. مواد ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده علوم ریاضی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023